U-Net

U-Netは、フライブルク大学コンピュータサイエンス学部で生物医学画像の分割用に開発された畳み込みニューラルネットワーク(CNN)である。[1]このネットワークは完全畳み込みニューラルネットワーク[2]を基にしていて、より少ないトレーニング画像で動作し、より正確なセグメンテーションができるように、アーキテクチャが修正・拡張されている。U-Netアーキテクチャを使用した最新(2015年)のGPUでは、512×512の画像のセグメンテーションにかかる時間は1秒未満である。[1]

U-Netアーキテクチャは、反復画像ノイズ除去のための拡散モデルにも採用されている。[3]この技術は、DALL-EMidjourneyStable Diffusionなど、多くの最新の画像生成モデルの基盤となっている。

  1. ^ a b Ronneberger O, Fischer P, Brox T (2015). "U-Net: Convolutional Networks for Biomedical Image Segmentation". arXiv:1505.04597 [cs.CV]。
  2. ^ “Fully Convolutional Networks for Semantic Segmentation”. IEEE Transactions on Pattern Analysis and Machine Intelligence 39 (4): 640–651. (Nov 2014). arXiv:1411.4038. doi:10.1109/TPAMI.2016.2572683. PMID 27244717. 
  3. ^ Ho, Jonathan (2020). "Denoising Diffusion Probabilistic Models". arXiv:2006.11239 [cs.LG]。

Developed by StudentB